SPSS Shapiro-Wilk 检验 – 快速教程与示例

作者:Ruben Geert van den Berg,归类于 Statistics A-Z & Basics

  • Shapiro-Wilk 检验 - 是什么?
  • Shapiro-Wilk 检验 - 零假设
  • 在 SPSS 中运行 Shapiro-Wilk 检验
  • Shapiro-Wilk 检验 - 结果解读
  • 以 APA 格式报告 Shapiro-Wilk 检验结果

Shapiro-Wilk 检验 - 是什么?

Shapiro-Wilk 检验用于检验某个变量在总体中是否服从正态分布。因此,Shapiro-Wilk 检验与 Kolmogorov-Smirnov 检验 的目的完全相同。一些统计学家认为 Kolmogorov-Smirnov 检验由于其较低的统计功效而较差,但也有人不同意。

举一个 例子,假设一位科学家声称,所有人在某项任务中的反应时间(一个总体)都服从正态分布。他随机抽取了 N = 233 人的样本,并测量了他们的反应时间。结果的直方图如下所示。

Shapiro Wilk Test - Histogram

这个频率分布看起来有点双峰。除此之外,它看起来相当合理——但不是完全——正态。但是,样本结果通常与总体有所不同。最大的问题是:如果反应时间在整个总体中完全服从正态分布,那么观察到的分布的可能性有多大?Shapiro-Wilk 检验正是回答了这个问题。

Shapiro-Wilk 检验是如何工作的?

一个技术上正确的解释可以在这个 Wikipedia 页面上找到。然而,一个更简单——但技术上不正确的——解释是这样的:Shapiro-Wilk 检验首先将观察到的分布和正态分布之间的相似性量化为一个单一的数字:它将一条正态曲线叠加在观察到的分布上,如下图所示。然后,它计算出样本与正态曲线重叠的百分比:一个 相似度百分比

Shapiro Wilk Test What Is It

最后,Shapiro-Wilk 检验计算出找到这个观察到的——或更小的——相似度百分比的概率。它在总体分布完全服从正态分布的假设下进行计算,即零假设。

Shapiro-Wilk 检验 - 零假设

Shapiro-Wilk 检验的零假设是:某个变量在某个总体中服从正态分布。另一种说法是,变量的值是来自正态分布的简单随机样本。通常,如果 p < 0.05,我们则拒绝零假设。在这种情况下,我们得出结论,我们的变量 服从正态分布。为什么呢?因为 p 基本上是如果零假设为真,我们找到我们数据的概率。如果这个概率(非常)小——但我们无论如何都找到了我们的数据——那么零假设可能就是错误的。

Shapiro-Wilk 检验 - SPSS 示例数据

一个 N = 236 人的样本完成了一些速度任务。他们的反应时间在 speedtasks.sav 中,部分数据如下所示。我们将只使用变量 r01 到 r05 中的前五个试验。

SPSS Shapiro Wilk Test Example Data

我建议你总是彻底检查所有你想分析的变量。由于我们的反应时间以毫秒为单位,是定量变量,我们将对它们运行一些快速直方图。我更喜欢从下面的简短 syntax (SPSS 语法) 中进行操作。更简单——但更慢——的方法在 在 SPSS 中创建直方图 中有介绍。

***Quick histograms with normal curves as data check.
**
frequencies r01 to r05
/format notable
/histogram normal.

结果

请注意,5 个直方图中的一些看起来很糟糕。一些数据似乎已损坏,最好不要认真分析。例外的是试验 4(如下所示),它看起来是合理的——甚至相当正态分布。

SPSS Shapiro Wilk Test Histogram

描述性统计 - 偏度与峰度

如果你正在阅读这篇文章来完成一些作业,你可能会被要求报告一些变量的描述性统计数据。这些数据通常包括中位数、标准差、偏度峰度。为什么呢?因为对于正态分布,

  • 偏度 = 0:它是完全对称的;并且
  • 峰度 = 0:它既不尖峰(“leptokurtic”),也不扁平(“platykurtic”)。

因此,如果我们从这样的分布中抽取许多值,得到的变量的偏度和峰度都应该接近于零。你可以从 FREQUENCIES 中获得这些统计数据,但我更喜欢使用 MEANS:它可以生成最好的表格格式,并且它的语法简短而简单。

***Descriptives table.
**
means r01 to r05
/cells count mean median stddev skew kurt.

***Optionally: transpose table (requires SPSS 22 or higher).
**
output modify
/select tables
/if instances = last /*process last table in output, whatever it is...*/
/table transpose = yes.

结果

SPSS Shapiro Wilk Test Skewness Kurtosis Table

试验 2、3 和 5 都具有很大的偏度和/或峰度。这表明它们在整个总体中 服从正态分布。对于试验 1 和 4,偏度和峰度更接近于零。所以现在我们对数据有一个基本的了解,让我们继续进行实际的检验。

在 SPSS 中运行 Shapiro-Wilk 检验

下面的屏幕截图将指导你如何在 SPSS 中正确运行 Shapiro-Wilk 检验。我们还将添加生成的语法。

SPSS Shapiro Wilk Test Analyze Explore Menu SPSS Shapiro Wilk Test Explore Dialog

按照这些屏幕截图操作将生成以下 语法

***Shapiro-Wilk test pasted from Analyze - Descriptive Statistics - Explore...
**
EXAMINE VARIABLES=r01 r02 r03 r04 r05
/PLOT BOXPLOT NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING PAIRWISE /*IMPORTANT!*/
/NOTOTAL.

运行此语法会生成大量输出。但是,我们正在寻找的唯一表格——“Tests of Normality(正态性检验)”——如下所示。

Shapiro-Wilk 检验 - 结果解读

Shapiro Wilk Test Interpretation

我们拒绝试验 1、2、3 和 5 在 α = 0.05 水平上的正态总体分布的零假设。“Sig.(显著性)”或 p 是如果在我们的 population(总体) 中分布是完全正态的,那么在我们的 sample(样本) 中找到观察到的——或更大的——与正态性的偏差的概率。如果试验 1 在总体中服从正态分布,那么找到这些样本数据的概率仅为 0.01——或 1%——的机会。这些值不太可能从正态分布中采样。因此,总体分布可能根本不是正态的。

因此,我们拒绝这个零假设。结论:试验 1、2、3 和 5 可能在总体中不服从正态分布。

唯一的例外是试验 4:如果这个变量在总体中服从正态分布,那么在我们的数据中找到的非正态性的概率为 0.075——或 7.5%——的机会。也就是说,这种非正态性很可能仅仅是由于抽样误差造成的。因此,对于试验 4,我们 保留 总体正态性的零假设,因为 p > 0.05。我们无法确定总体分布是否为正态。但根据这些数据,我们相信它是正态的。至少现在是这样。

以 APA 格式报告 Shapiro-Wilk 检验结果

要以 APA style (APA 格式) 报告 Shapiro-Wilk 检验结果,我们包括 3 个数字:

  • 检验统计量 W——在 SPSS 中被错误地标记为“Statistic”;
  • 与其相关的 df ——是自由度的缩写;并且
  • 其显著性水平 p——在 SPSS 中标记为“Sig.”。

屏幕截图显示了如何将这些数字组合在一起以报告试验 1 的结果。

Shapiro Wilk Test - APA Style Reporting Example

正态性检验的有限用处

Shapiro-Wilk 检验和 Kolmogorov-Smirnov 检验 都检验一个变量是否在某个总体中服从正态分布。但为什么要费心呢?那是因为许多统计检验——包括 ANOVA (方差分析)t-tests (t 检验)regression (回归) ——都需要 normality assumption (正态性假设):变量必须在总体中服从正态分布。然而,只有当样本量较小——比如 N ≤ 20 左右——时,才需要正态性假设。对于较大的样本量,无论值在总体中如何分布,均值的 sampling distribution (抽样分布) 始终是正态的。这种现象被称为 central limit theorem (中心极限定理)。结果是,即使严重违反正态性,许多检验结果也不会受到影响。

因此,如果样本量合理,正态性检验通常是 pointless (毫无意义) 的。可悲的是,很少有统计学讲师意识到这一点,仍然用这些检验来打扰学生。这也是我写这篇教程的原因。

嘿!但如果样本量很小,比如 N < 20 左右呢?好吧,在这种情况下,许多检验 确实 需要服从正态分布的变量。但是,正态性检验通常在小样本量中具有较低的功效。因此,即使与正态性的显著偏差也可能不具有统计学意义。因此,当你真正需要正态性时,正态性检验不太可能检测到它实际上被违反了。这使得它们变得相当无用。

感谢阅读。